7月6日是“浙江大学CAD&CG计算机图形学与大规模数据分析研讨班”的第五天。下午2时,浙江大学可视分析小组5名成员在浙江大学紫金港校区国际会议中心139报告厅进行了一场有关“可视化与可视分析”的展示报告。小组成员各自以个人研究兴趣为出发点,通过不同视角为讨论班学员展示了一个个色彩纷呈的可视化世界。
彭帝超:可视化论文之特色
作为组内信息可视化方向的领军人物之一,彭博士带来了他在可视化研究过程中的经验分享——在学术论文写作上,信息可视化与其他研究方向之间区别如何?在论文写作风格上有什么特色?针对这些问题,彭博士从思路、结构、展示和评价四个方面进行了阐释。
思路 - 寻找隐喻
科学发现离不开对自然界的观察。在可视化论文中,一个可视化效果往往来源于人们在自然界中的发现和自身真实体验的融合。在忠实表达数据信息的同时,给予人以自然之美。这种可视化与真实体验相结合的过程被称作隐喻(metaphor)。2011年InfoVis论文《TextFlow: Towards Better Understanding of Evolving Topics in Text》就以河流隐喻时间流,表现出同源文本在一段时期内的话题流变。
结构 - Teaser当先
对于大多数可视化方面的论文来说,扉页的Teaser(效果图)是可视化论文的标志之一。Teaser作为能够让读者“眼前一亮”的点睛之笔,是用来呈现论文中可视化效果的精髓,同时也是论文观点的浓缩体现。通常Teaser以单幅图来展示文中的创新点,或是以新旧方法对比的方式呈现本文方法的优势;对于拥有Demo展示的可视化论文来说,经常以Demo整体界面充当文章Teaser。
展示 - 配色协调
注重可视化方法的同时,结果展示的美观性也是影响论文质量的因素之一。彭博士特别强调了结果展示中的配色协调问题。可视化也是一种艺术创作,在色彩搭配上需要从美学标准出发并进行思考。因此对于信息可视化工作者来说,手边常备一套配色方案工具十分必要。
评价 - 设计严密
从方法评价角度讲,可视化论文不同于其他研究方向的论文,带有非常浓厚的主观色彩。对于写作者来说,如何设计一个好的User/Case Study是论文写作中最需要思考的部分之一。针对可视化论文的主观评价特性,彭博士向我们分享了自己在论文写作时的一套思路,即:可视化方法的潜在用户是谁->是否有用户参与设计->用户/领域专家如何评价结果->有什么需要改进的地方。对于User Study来说,用户结果统计是展现调查结果的有力方式,而Case Study则需要对方法呈现出的结果进行深入分析。
刘真:当前可视化方向的热点与挑战
刘真老师在随后进行的展示中就当前科学可视化、信息可视化和可视分析三个方向上的热点问题和挑战展开了讨论:
关键词分布 - visualization vs. analysis
上图是Vis、InfoVis和VAST三个领域内顶级会议的关键词分布wordle。对于Vis和InfoVis来说,vIsualization这个关键词必然是最醒目的,然而在VAST会议中,visualization被排到了一个比较次要的位置,取而代之的是data、analytics、interface等更偏重于数据分析的关键词。从统计数据上可以明显看出,VAST会议与Vis、InfoVis有着本质上的差别。
研究热点 - 百家争鸣
针对科学可视化,刘老师提出了三维体、医疗以及流场等体数据的可视化、信息可视化向科学可视化的引入,以及高性能可视化三个方面的热点。随着数据量以及数据的复杂度不断增长,多维数据、图、树和地理信息可视化将成为今后研究的热点问题。区别于科学可视化与信息可视化,可视分析方向的研究热点则集中于对分析过程的研究,包括可视分析过程基础理论,针对树图结构、语义架构和时空数据的交互可视分析方法,以及协作可视分析。
应用需求 - 迎接大数据
在当下“数据为先”的时代,很多领域都需要一种能够针对大数据、复杂结构数据来进行分析的方法,其中包括科研领域(超级计算、地质勘探、地球物理等)、国家战略及公共服务领域(国防、安全等),以及商业领域(社交媒体、企业业务数据等)等。这些领域中的需求正是可视化及可视分析在大数据时代所拥有的机遇。
研究挑战 - 更深、更广、更复杂
可视分析作为一个新兴学科,其理论根基尚显薄弱。随着当前可视分析应用蓬勃发展,研究者需要逐渐深入应用,寻找可视分析基础方法理论,建立学科基础。面对大数据时代的发展机遇,面向大规模、复杂结构数据的处理性能、可视化表达方面的研究也将成为可视化及可视分析的重点问题之一,例如基于云计算的云端可视化方案,面向实时数据、高维数据、社交网络数据、文本数据等的可视化方法等。
博士生
除了组内两位老师外,VAG的3名博士生也各自分享了一些自己感兴趣的话题:
夏菁 - 可视建模
对可视化过程进行合理建模是可视化应用的关键。从数据处理、视觉映射、布局及交互,可视建模的每个阶段都决定着数据信息是否能忠实、有效地进行表达。在视觉映射阶段,我们通常需要做的是建立从数据到图形的形状、大小、颜色、位置的映射,使用图形的不同特征表达数据中的特征。在布局阶段,要将这些图形元素按照一定规律进行排列,以达到展现数据内涵的目的。对交互建模来说,经典的“Overview first, zoom and filter, then details-on-demand”已经成为交互设计的基本原则之一。基于这样的原则,如何快速找到POI(point-of-interest)成为交互建模中一个重点研究问题。
吴斐然 - 可视化与人的关系
随着计算能力的不断增加,人们处理数据的能力也在不断增强。然而,仅仅依赖于计算方法以及计算智能来进行数据分析远远无法满足当前复杂分析的需要。验证码识别就是一个很好的例子:人类强大的模式识别能力在识别验证码上远胜过计算机,而计算机擅长重复计算及数据存储的能力在这里无法得到应有的发挥。因此,可视分析基于这样的出发点,试图形成一套人与机器进行协作式数据探索的方法。在人机协作方面,可视编码和交互式输入成为连接用户和计算机的有力纽带。可视编码通常使用标记(点、线、面)和通道(位置、大小、形状、方向、颜色等)两个维度来表达数据特征(如类别、关系、顺序、数量等)。在交互设备上,我们已经开始从传统的显示器走向大型显示屏、增强现实眼睛等新型交互手段。
马昱欣 - KDD Cup与VAST Challenge
作为数据探索和知识发现的两个不同方向,KDD和VAST都拥有属于各自方向的研究竞赛——ACM KDD Cup和IEEE VAST Chanllenge——来促进学科发展和发现更好的数据探索方法。KDD Cup开始于1997年,其比赛内容涵盖生物、医药、商业、网络安全以及社交网络等多种方向的数据,并针对数据内容提出相应的探索目标。VAST Chanllenge自2006年开始创办,比赛数据类型广泛涉及文本、计算机网络、社交关系等。从任务目标上看,KDD Cup多为较明确的数据挖掘规则,并且通常针对一套数据仅提出一项任务,同场比赛的数据之间没有关联,而VAST Challenge通常有Mini Challenge和Grand Challenge两个组别,Mini Challenge针对单一数据,Grand Challenge则涵盖比赛中的数据。因此在解题方法上,KDD Cup通常使用算法/机器学习式的数据挖掘方法, VAST Chanllenge中竞赛者则需要完成一套交互式可视分析方案,并使用该方案分析回答竞赛问题。在结果评定方面,KDD Cup以预测准确度为客观评价标准,但在VAST Chanllenge中评审者会对参赛作品进行各个方面的评价。
自由讨论:科学还是艺术?
在展示报告过程中,讨论班学院们就报告主题和其他可视化相关问题进行了热烈的讨论。其中热门话题之一便是:可视化到底更偏向于科学,还是更偏向于艺术?
- 科学 – 忠实反映信息
从可视化的目的上讲,反映数据内部的信息和内涵是可视化的根本目的之一。可视化方法作为一种科学方法,需要对一类数据具有一定的普遍适用性,并且当前可视化技术均依赖于计算机的实现,因此将可视化称作科学理所应当。
- 艺术 – 提高作品层次
作为一种视觉展示手段,可视化除了需要忠实反映数据内部信息以外,它同时需要拥有良好的视觉设计,和自然、适合于数据本身的视觉映射方法,以提供给人更好的交互体验,这部分便是可视化的艺术性所在。
✉️ zjuvis@cad.zju.edu.cn